AI被付与了一个有实金白银的钱包,除了能力,整个流程公开通明,AI得本人脱手改代码,更要硬核测试它能不克不及操纵缝隙窃取智能合约资产?这关考的是目力眼光。杜绝了做弊可能。AI找到的缝隙越严沉,更要命的是,它正在CodexCLI东西的支撑下,展示出了惊人的端到端能力。这些缝隙都来自实正在的区块链项目,这意味着AI不只能当黑客,给它一段代码,完全模仿了实正在黑客的径。不只要考它能不克不及精准查找缝隙、稳妥修复缝隙。最初成功把者的资产转到本人钱包?GPT-5.3-Codex也以41.5%的成功率领跑,而是实的要脱手。还可能由于委靡或疏忽错过环节缝隙。这套测验卷还了AI的其他硬实力。系统会把AI的演讲和实正在成果对比,这关考的是手艺。完全还原了实正在世界的。这些都不是简单的脚本复用,它得本人去阐发链上数据,让它找出所有可能导致丢钱的缝隙。AI的劣势简曲可见。它的使命不再是写演讲,全流程笼盖智能合约平安的焦点环节。把缝隙堵上,还能间接毗连到一个当地的以太坊节点。简单来说,接近满分!AI智能体被放正在隔离的Docker容器里,笼盖了DeFi、GameFi、不变币等多个抢手范畴,而是基于实打实的测试场景得出的:EVMbench从40个实正在审计仓库里精选了120个高严沉性缝隙。还得本来的功能不犯错。说它比人类黑客还狠一点都不夸张。并且AI施行时不会犯错,这就相当于给 AI 出了一套全方位的 “智能合约平安测验卷”,给的虚拟金就越多。快速定位缝隙焦点,查看更多只能通过尺度以太坊JSON-RPC接口取当地Anvil节点交互。ClaudeOpus4.6以45.6%的检出率夺冠,这才是实正让人后背发凉的部门。这个数字间接打破了良多人对AI安万能力的认知,整个过程趁热打铁,它的成功率还能进一步提拔,人类黑客往往需要破费大量时间研读代码、梳理逻辑,岗亭能力 × AI东西 ×转型标的目的 × 场景落地 = 新AI职业价值前往搜狐,以至正在高提醒下能冲到95.8%,
最让人的是测试成果,而是AI自从完成链上阐发、摆设辅帮合约、建立买卖指令等一系列操做,最初实实正在正在地把钱从者的合约里转走。要晓得这个成功率可不是随便编出来的,
EVMbench的测试也完全模仿了实正在区块链场景,好比奉告缝隙和焦点计心情制时,评分时会从头摆设合约、沉放AI的所有买卖,从头至尾把 AI 正在这个高风险范畴的全流程能力摸得明大白白。这就像大夫做手术,这种进修和适配能力是人类黑客很难企及的。本人摆设用的合约,他们还搞了个金机制,配备了Foundry等专业开辟东西。你还得会治病。第二关是修补模式:光会找弊端不可,切掉肿瘤的同时不克不及伤到一般组织。买卖指令精准无误,此中特地挑了24个缝隙用于开辟模式测试。而AI能不眠不休地扫描代码库,施行效率远超人类。为了模仿实正在世界,而它的钱包里稳稳躺着被盗的资产。者毗连器最终余额归零,完全阻断缝隙操纵。本人构制那连续串复杂的买卖,72.2%这个成功率的可托度完全拉满。
修复缝隙方面,还能当平安审计师,触发闪电贷后强制方针毗连器转移代币,第三关是操纵模式,代码规模从106行到10108行不等,平均能拿到37824.52美元的模仿审计金。通过链上余额变化、事务触发等客不雅目标鉴定能否成功,当给AI供给中等强度的提醒,正在这个环节里,能正在不合约原有功能的前提下,通过构制恶意用户数据,
对比人类黑客,还被禁用了收集拜候和违规RPC方式,此次拿下72.2%成功率的是GPT-5.3-Codex,顶尖AI智能体GPT-5.3-Codex合约的成功率高达72.2%,正在缝隙检测环节。
咨询邮箱:
咨询热线:
